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摘 要 : 射电 天 文 已 成 为 人 类 研究 宇宙 的 重要 途径 。 但 随 着 人 类 生产 、 生 活 的 发 展 ， 射 
频 干 扰 信 号 对 射电 天 文 观测 的 影响 越 来 越 严重 ,观测 数据 的 好 坏 关系 到 科学 成 果 的 质量 其 至 
结论 的 真 伪 。 目前 广泛 采用 基于 辣 值 判断 射频 干扰 , 对 干扰 信号 直接 舍弃 部 分 观测 数据 的 方 
法 。 此 类 方法 存在 阀 值 确定 困难 、 观 测 带 宽 和 时 间 被 缩减 等 问题 。 本 文 针 对 脉冲 星 观 测 射 电 
信号 中 , 各 干扰 信号 及 射电 信号 统计 独立 以 及 呈现 出 的 非 高 斯 性 ,利用 独立 成 分 分 析 对 混合 
信号 进行 分 解 ; 并 根据 观测 信号 中 脉冲 星 信 号 和 干扰 信号 的 分 布 特点 ， 识 别 脉冲 蜂 信 号 ， 实 
现 干扰 信号 消除 .使 用 该 方法 对 云南 天 文 台 40 米 射电 望远镜 接收 到 的 脉冲 星 观 测 信 号 进行 独 
立成 分 分 析 ， 分 解 出 独立 的 RFI 信 号 和 脉冲 星 信 号 ， 消 除 射 频 干 扰 信号 。 本 文 方法 在 干扰 信 
号 消除 、 射 电信 号 保留 及 信 骂 比方 面 均 取 得 良好 效果 . 
关键 词 :射频 干扰 ; ”独立 成 分 分 析 ; ”脉冲 星 ; 干扰 信号 消除 
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0 引言 


射电 信号 正在 成 为 人 类 研究 宇宙 的 重要 窗口 出。 尤其 是 针对 脉冲 星 检测 和 观测 已 成 为 射 
色 天 文 的 重要 研究 内 容 。 从 凝聚 态 到 量子 色 动 力学 ， 以 及 一 系列 涵盖 恒星 演化 、 星 际 介质 、 
宇宙 学 的 天 体 物 理学 主题 ， 脉 冲 星 为 其 提供 了 不 可 奉 代 的 实验 环境 上 。 通 过 脉冲 星 观测 直 
痿 证 实 了 太阳 系 外 行星 的 存在 号， 为 暗物质 的 本 质 及 分 布 的 研究 提供 了 条 件 ， 并 首次 为 引力 
波 的 存在 提供 了 间接 证 据 品 。 
然而 ， 射 频 干扰 (Radio Frequency Interference, RFI) 成 为 上 述 研究 的 重要 挑战 四 。 在 
射电 天 文中 ，RFI 广 义 上 指 由 人 类 生产 和 生活 活动 而 产生 的 无 线 电 信号 ， 包 括 电 视 信 号 、 调 
频 无 线 电 传 输 、 全 球 定位 系统 (GPS)、 手 机 和 飞机 导航 通讯 等 ， 对 接收 的 微弱 天 文 信号 造成 
的 影响 四 ,不同 来 源 RFI 在 时 频 特 性 上 的 差异 使 得 针对 所 有 类 型 的 RFI 信 号 进行 建 模 变 得 非常 
复杂 和 困难 钻 。 为 减少 RFI 干 扰 ， 射电 望远镜 在 选 址 时 ， 通 常 在 没有 或 者 很 少 受到 RFI 影 响 的 
地 理 环境 中 建造 望远镜 ，, 并 和 相关 政府 部 门 协调 规划 出 无 线 电 宁静 区 。 但 随 着 射电 天 文 仪器 
灵敏 度 不 断 提升 , 接收 到 非 天 文 信号 的 干扰 也 越 来 越 明显 。 宽 带 、 广 播 和 通信 中 频谱 的 大 量 
使 用 ， 以 及 越 来 越 多 的 大 规模 生产 、 经 济 和 商业 活动 ， 低 功率 人 工 宽 带 信号 的 使 用 也 变 得 越 
来 越 频 繁 ， 这 些 都 会 产生 射电 天 文 数 据 中 很 难 消 除 的 干扰 信号 ， 使 已 有 RFI 问 题 变 得 愈 发 严 
重 品 。 例 如 ， 云 南天 文 台 利 用 40 米 射电 望远镜 $ 波 段 (2150MHz~2450MHz) 开展 脉冲 星 观测 
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任务 。2006 年 5 月 投入 运行 之 初 RFI 相 对 较 少 ， 但 由 于 该 望远镜 距离 昆明 市 区 较 近 (距离 市 
中 心 直 线 距离 8.2 公 里 ) ， 且 随 着 城市 建设 不 断 发 展 〈 距 东 三 环 直线 距离 1.3 公 里 ) ， 包 括 2G、 
3G、4G 手 机 信和 号 频段 和 WIFI 频段 的 RFI 越 来 越 多 ， 这 些 干 扰 信和 号 严重 影响 了 日 常 射电 天 文 
观测 。 例 如 ， 图 1 展示 了 云南 天 文 台 40 米 射电 望远镜 观测 到 的 脉冲 星 信 号 。 其 中 除 期 望 的 脉 
剖 星 信号 外 ， 可 清楚 观测 到 RFI。RFI 产 生 的 来 源 和 射电 望远镜 运行 的 机 理 决 定 了 几乎 所 有 
射电 望远镜 均 面 临 RFI 问 题 。 观 测 数据 的 好 坏 关 系 到 科学 成 果 的 质量 甚至 结论 的 真 伪 ， 开 展 
RFI 抑 制 和 消除 方法 研究 对 射电 天 文 发 展 具有 重要 理论 意义 与 实际 应 用 价值 。 


三 2270 EGE oed Ai a a -一 有 这 
Fs 
2240 
5 
e] 
g 2210 
2180 
0.2 04 06 08 1 
Pulse Phase 


图 1 脉冲 星 3033245434 频 域 柱状 图 


Fig. 1 The phase distributions of J0332+5434 in frequency domain 


REFI 消 除 目 的 在 于 尽量 保持 天 文 信号 的 前 提 下 ， 消 除 射 电 于 扰 。 依 据 RFI 消 除 方案 在 射 
电 天 文 观测 阶段 的 不 同 可 分 为 四 个 环节 加: 观测 站 预防 、 预 检测 、 预 相关 以 及 应 用 于 干涉 数 
据 的 后 相关 方案 。 对 于 已 经 建 好 投入 使 用 的 射电 望远镜 ， 后 相关 处 理 尤 显 关 键 和 重要 ， 本 文 
主要 针对 该 环节 研究 RFI 消 除 方法 。 

后 相关 消除 方法 的 基本 思想 基于 : 通过 统计 分 析 数 据 来 准确 标记 RFI， 即 ， 通 过 时 频 二 
维 平面 上 REFI 信 和 号 与 天 文 信 号 形态 特性 差异 标记 并 消除 RFI。 天 文 信号 通常 呈现 宽带 、 平 滑 
且 时 间 跨 度 大 的 特点 ， 而 RFI 信 号 经 常 在 时 频 平 面 上 呈现 为 高 强度 像素 。 目 前 的 RFI 消 除 方 
TEN] A> API. BITTER SEF BITE, GU Bb AT PS Ba BSR ATT I. IK 
类 方法 把 REFI 定 义 为 在 时 频 平 面 上 超过 某 些 阔 值 的 像素 。 算 法 简单 、 高 效 ， 被 广泛 应 用 于 射 
电 数 据 处 理 呈 。 但 此 类 方法 最 大 的 问题 在 于 : 如 何 根据 RFI 源 及 观测 天 体 确 定 阔 值 ? 尤其 是 
在 针对 脉冲 星 等 时 变 天 体 信 号 ， 阅 值 选择 尤为 关键 。 例 如 ， 在 对 LOFAR 的 恒星 撕 裂 时 间 天 
体 Swift J1644+57 进 行 研究 时 ， 并 未 检测 到 预期 的 源 ， 分 析 原 因 可 能 是 其 微弱 瞬时 信号 被 认 
定 为 RFI 而 删除 趾 。 第 二 类 方法 采用 基于 机 器 学 习 的 方法 。 近 年 来 ， 机 器 学 习 尤 其 是 深度 学 
习 技 术 在 众多 领域 取得 了 令 人 瞩目 的 研究 成 果 , 已 有 研究 将 机 器 学 习 中 的 有 监督 学 习 以 及 深 
度 学 习 的 方法 应 用 于 REFI 消 除 ， 取 得 一 定 研 究 进展 。 例 如 文献 [12] 基 于 KK 近邻 (k-Nearest 
Neighbor) 和 混合 高 斯 模型 (Gaussian Mixture Models) 对 REFI 信 和 号 进行 聚 类 ， 从 而 实现 REFI 
标记 ; 文献 [13] 对 基于 ANN (Artificial Neural Network) 、Adaboost、GBC (Gradient Boosting 
Classifier) 和 XGBoost (eXtreme Gradient Boosting) 实现 的 四 种 有 监督 学 习 RFI 分 类 方法 的 
效果 进行 了 分 析 和 比较 。 但 该 类 基于 有 监督 学 习 方法 的 关键 问题 是 : RFI 分 类 准确 度 对 特征 
选取 非常 敏感 。 为 了 减少 对 特征 的 依赖 ，Akeret 等 将 深度 学 习 的 方法 应 用 于 RFI 消 除 趾 ， 对 
模拟 RFI 信 号 取得 了 非常 好 的 效果 。 但 这 种 采用 模拟 数据 对 深度 网 络 进 行 训练 的 方式 ， 很 难 
防止 过 拟 合 。 

独立 成 分 分 析 (Independent Component Analysis, ICAEW F B Wa sa A (Blind Signal 
Separation, BSS) 。BSS 是 信号 处 理 中 一 个 传统 而 又 极 具 挑 战 性 的 问题 ， 指 仅 从 若干 观测 的 
混合 信号 中 恢复 出 无 法 直接 观测 的 各 个 原始 信号 的 过 程 'H。 这 里 的 “ 盲 ”， 既 指 源 信号 不 
可 测 ， 又 指 混合 系统 特性 事先 未 知 。 所 谓 “鸡尾酒 会 问题 ”就 是 BSS 的 典型 例子 。ICA 是 研 
究 BSS 的 一 个 重要 方法 ， 基 于 信号 高 阶 统 计 特性 已 成 为 阵列 信号 处 理 和 数据 分 析 的 有 力 工 
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具 。 显 然 ，ICA 所 涉及 的 问题 ， 在 数学 模型 上 本 身 是 从 定 的 ， 但 附加 上 原始 信号 间 统 计 独立 
及 原始 信号 非 高 斯 分 布 两 个 条 件 后 ， 各 原始 信号 可 完美 复原 ""。 本 文中 ， 我 们 将 射电 望 远 
镜 观 测 到 的 脉冲 星 信 号 看 作 观 测 信号 ， 而 包含 其 中 的 各 RFI 和 脉冲 星 信号 视 为 原始 信号 。 各 
RFI 信 号 和 脉冲 星 信 号 间 统 计 上 相互 独立 且 各 信号 符合 非 高 斯 分 布 ， 满 足 ICA 假 设 条 件 。 相 
比 已 有 方法 ， 首 先 ， 无 需 人 为 选择 或 构造 RFI 结 构 特征 ， 不 存在 闪 值 选择 的 困惑 ， 其 次 ， 不 
存在 训练 或 学 习 过 程 , 因此 无 需 考 虑 构建 训练 样本 的 问题 。 使 用 该 方法 对 云南 天 文 台 40 米 射 
BE 望远镜 接收 到 的 脉冲 星 观 测 信号 进行 独立 成 分 分 析 ， 分 解 出 独立 的 RFI 信 号 和 脉冲 星 信 
号 ， 进 而 实现 RFI 消 除 ， 取 得 良好 效果 。 


1 独立 成 分 


析 


ICA 是 近年 来 发 展 起 来 的 一 种 统计 方法 。 该 方法 目的 是 将 观察 到 的 数据 进行 某 种 线性 分 
解 使 其 分 解 成 统计 独立 的 成 分 。 为 严格 定义 ICA 模 型 ， 使 用 统计 隐 变 量 模型 表示 z 个 同一 时 刻 
接收 到 的 射电 信号 xl， tts Xn 〈 混 合 信 号 ) : 


Pa 


X; =a S, taps + +a, S ,i Sleen 


in n? 


其 中 ，s; 表 示 包 含 在 混合 信号 x; 中 的 源 信 号 (独立 成 分 ) ， 即 ，RFI 信 号 或 脉冲 星 信 号 。 这 里 
混合 信号 x 和 独立 成 分 s; 均 可 视 为 随机 变量 。 不 失 一 般 性 ， 设 xj 和 si; 为 零 均值 (混合 信号 xi 总 是 
可 以 通过 减 去 样本 均值 实现 零 均 值 化 ) 。(1) 式 的 矩阵 形式 为 : 

x=As 
JE, xsia xy, ot, fso oo, SARRIENA ts 矩阵 A 由 (1) 式 系数 元 素 aj 组 成 ， 
称 为 混合 矩阵 。(2) 式 即 为 IJCA 模 型 ， 描 述 通过 独立 成 分 % 得 到 混合 信号 zx 的 过 程 。 目 标 是 求 
解 独立 成 分 5，(2) 式 可 调整 为 : 


s= Wx , 
其 中 ， 和 矩阵 W=A-， 称 为 解 混 矩 阵 。 独 立成 分 s 为 隐 随 机 向 量 ， 意 味 着 s 不 能 被 直接 观测 到 ， 
需要 根据 仅 有 信息 一 一 随机 向 量 x 估 计 出 混合 矩阵 A 和 独立 成 分 gs。 显 然 ， 该 问题 在 数学 模型 
上 欠 定 。 但 在 附加 两 个 假设 情况 时 间 题 变 得 可 解 : 〈1) 独立 成 分 8 间 相 互 统 计 独 立 ; (2) 
独立 成 分 s; 拥 有 非 高 斯 分 布 。RFI 产 生 自 人 类 活动 ， 而 天 文 射电 信和 号 产生 自 宇 宙 天 体 ， 二 者 
之 间 相 互 统计 独立 ， 且 分 布 上 也 不 会 呈现 高 斯 分 布 ， 因 此 电 天 文 RFI 消 除 满足 ICA 模 型 假设 
条 件 。 


1. 1 1CA 估 计 


由 概率 论 中 心 极限 定理 可 知 ， 多 个 独立 随机 变量 的 混合 信号 趋 近 于 高 斯 分 布 。 因 此 , 在 
ICA 模 型 中 ， 若 干 个 独立 成 分 8 组 成 的 混合 信号 Xi 比 任何 独立 成 分 8 更 接近 高 斯 分 布 。 于 是 可 
使 用 分 离 信号 的 非 高 斯 性 作为 分 离 信号 之 间 独 立 性 的 度量 。 

求解 基本 ICA 问 题 的 通用 步骤 包括 三 步 中 (1) 数据 (混合 信号 ) 的 预 处 理 , 包括 中 心 化 、 
白化 。 〈2) 选择 或 定义 非 高 斯 性 (独立 性 ) 度 量 ， 建 立 目 标 函 数 。 该 函数 取 极 值 时 ， 估 计 出 
的 独立 成 分 之 间 非 高 斯 性 最 大 。 目 标 函 数 代 表 一 种 分 离 准则 , 根据 不 同 分 离 准则 推导 出 不 同 
ICA 估 计算 法 。 G) 用 茶 种 最 优化 方法 最 大 (小 ) 化 目标 函数 ， 实 现 ICA 估 计 。 依 据 非 高 斯 性 
度量 方法 的 不 同 ，ICA 估 计 方 法 可 分 为 基于 峰 度 〈Kurtosis) MAHI (Negentropy) 。 由 于 基 
于 峰 态 的 ICA 估 计 方 法 在 实际 应 用 中 对 边缘 样本 过 于 敏感 ， 导 致 其 鲁 棒 性 较 差 54， 因 此 本 文 
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(2) 
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WK. fad 
量 随 机 变量 的 非 高 斯 


其 中 ，a; 是 y 的 可 能 取 值 。 


定义 为 : 


中 ，ysuus 为 与 ?具有 相同 方差 的 高 其 
而 其 他 情况 则 非 负 。 
WEE SUIT, 涉及 到 估计 信 
时 的 方式 近似 计算 负 业 。 


用 更 简单 


\ 论 的 一 个 重 如 


性 。 随 机 变革 


EE 要 结果 为 : 相同 方差 时 ， 


Hayy Ee SON: 


H(y)=—)/ PO =4;)log P(y =a;) 
由 (4) 式 可 知 ， 炳 为 负 值 。 述 随机 变量 的 非 高 斯 性 
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其 中 ， RAE 


数 ，" 为 零 均值 和 音 


从 出 发 ， 


斯 随机 变量 。(5) 式 表明 : 对 于 高 斯 随机 变量 
负 炳 是 对 非 高 斯 性 估计 的 最 优 方 法 中 


党 号 的 概率 密度 函数 ， 在 实际 应 


=k [B{G(y)}- 


用 中 这 往生 


时 > 呈现 高 


(9) 式 非 负 ， 
当 仅 使 用 


位 方差 的 高 斯 随机 变量 ，G; 为 非 二 次 函数 。 需 要 注 


当 随 机 变量 斯 分 布 时 ， 其 值 为 零 。 
一 个 非 二 次 函数 时 ， 对 任意 非 二 次 函数 G，(6) 式 近似 为 : 


7(7) | E{G(y)}-E{G(v)} 
-函数 C 的 选择 。 一 般 情况 下 ， 选 择 非 快速 增长 函数 C， 通 


2 


关键 之 处 在 于 函数 G 的 选择 
的 负 焙 估计 。 例 如 : FIGE BCE BA Ze Si fe EE AE a A 


G,(u) = Ming coshau, G,(u)= —exp(-u? / 2) 
1 
其 中 ，ai 为 介 于 1 与 2 间 的 常数 ,通常 取 al=1。 实 际 应 用 中 可 使 用 FastICA 算法 加 寻找 (7) 
式 所 表示 的 非 高 斯 性 最 大 值 。 


2 基于 1CA 的 RF1 消 除 的 实现 


并 成 分 中 选择 


出 脉冲 星 


言 号 ， 也 是 实现 的 关键 。 


2.1 射电 数据 预 处 理 


实现 中 ， 
所 谓 
m=E{x} 实现 。 此 时 ， 
化 ICA 估 计 。 使 


数据 预 处 理 包 括 
FP 心 化 ， 即 ， 将 观测 到 的 射电 信号 
时 ， 对 (2) 式 两 边 取 期 望 可 知 ， 独 立成 分 s 也 为 零 均 值 


中 心 化 后 的 射电 观测 数据 估计 出 混合 


中 心 化 和 


化 。 


ad a 
C NINAX IV 


期 刊 | 


合作 所 


因此 可 ) 


CHAN, 


J5 


(4) 


S 
= 


(5) 


a SUR NO, 
(5) 式 


v7 


。 但 使 用 


非常 困难 ， 因 此 通常 采 


过 (6) 式 可 得 到 更 鲁 棒 


言 号 处 理 为 零 均 值 。 可 通过 观测 向 是 
。 中 心 化 的 目的 在 于 简 


(8) 


上 而 介绍 了 ICA 模 型 、 负 炉 近 似 以 及 快速 迭代 求解 对 比 函 数 的 方法 。 为 使 算法 更 为 高 效 
将 ICA 运 用 到 射电 天 文 RFI 消 除 前 ， 需 考虑 数据 初始 化 问题 。 此 外 ， 如 何 从 ICA 分 解 得 到 的 独 


三 


量 x 减 去 均值 所 


矩阵 A 后 ， 可 将 s 的 均值 向 量 A-m 加 到 


ChinaXivG (FHF 


零 均值 独立 成 分 上 ， 从 而 完成 独立 成 分 估计 。 
化 可 减少 ICA 估 计 中 的 参数 。 所 谓 白化 ， 即 ， 将 观测 到 的 射电 信和 号 x 转 换 为 非 相关 且 


RAAHAA RIE, EE =, 可 通过 对 x 协 方差 矩阵 特征 值 分 解 实现 白化 : 


E{xx" } = EDE" (9) 


其 中 , E X E{xx" REEERE, D AHERE R AEE: D=diag(d，…, d)。 
注意 ，(9) 式 的 值 可 通过 不 同时 刻 射 电 观 测 信号 x(1)，…，x(D) 得 到 ， 因 此 ， 白 化 可 记 为 : 


X=ED E'x (10) 


其 中 ，D- ”= diag(dr,…,d， )。 可 以 验证 EK =L 将 白化 后 的 观测 向 量 多 带 入 


(2) 式 可 得 : 
X=ED ExAs= As (11) 


其 中 A =ED-Y2ETIXxA ， 为 新 的 混合 矩阵 。 由 


E{xx'} = AE{ss"}A? = AA" =I (12) 


可 看 出 , 白化 后 , 新 的 混合 矩阵 A HEZE, KERA n(n-1)/2 个 自由 度 。 若 不 进行 白化 ， 
则 需 估计 混合 矩阵 A 的 好 2 个 参数 。 

为 便于 表述 ， 下 面 所 描述 的 射电 观测 信号 x 为 中 心 化 和 白化 后 的 数据 ， 而 混合 矩阵 统一 
表述 为 A。 


Comon Pierre 证 明了 ICA 的 售 混 性 中 一 一 ICA 不 能 确定 独立 成 分 的 顺序 ， 即 ,通过 ICA 模 
型 ， 可 由 射电 观测 信号 x 估计 出 混合 矩阵 A 或 解 混和 矩阵 W)》 进 而 得 到 源 信号 s， 但 无 法 确定 
s 的 组 成 成 分 sy ，…，s, 中 ， 哪 一 个 是 脉冲 星 信 号 ， 哪 些 是 RFI。 

观察 图 1 所 示 脉 冲 星 观 测 数据 可 发 现 : (1) 数据 列 在 相位 上 对 齐 。 因 此 脉冲 星 观 测 信 
号 (图 像 )x 的 每 一 行 可 视 为 一 个 相 变 信号 : 20，…，2(D， 由 此 估计 出 的 源 信和 号 向 量 s 也 
相 变 信号 s1()，…，s(D) 组 成 ， 为 保证 A 是 满 秩 和 矩阵 ， 要 求 n>m; (2) 相对 于 RFI 信 号 ， 肪 
冲 星 信号 呈现 出 强 宽带 特性 ， 即 ， 对 于 脉冲 星 信号 ， 数 据 行 与 行 之 间 有 更 强 相 关 性 。 此 外 ， 
(2) 式 可 知 和 矩阵 A 第 ; 行 元 素 实 质 上 是 将 源 信号 sI(D，…，snw(D 混 合成 第 ;个 频率 通道 观测 信和 号 
xD 的 权重 ， 第 ) 列 元 素 对 应 于 将 第 /个 源 信 号 s(D 混 合 到 各 频率 通道 观测 信号 zi(D，…，x(D 
的 权重 。 由 混合 矩阵 A 各 元 素 含义 及 上 述 发 现 (2) 可 知 ， 若 sj(D) 对 应 脉冲 星 信号 ， 则 和 矩阵 A 
第 / 列 将 呈现 均匀 分 布 的 特点 ， 可 用 方差 或 标准 差 衡量 随机 变量 均匀 分 布 程度 。 此 外 ， 实 际 
中 REFI 源 数目 不 可 预知 ， 且 一 般 有 z 大 于 RFI 源 数目 ， 由 此 会 造成 矩阵 A 某 些 列 标准 差 很 小 且 
中 值 也 很 小 ， 此 时 这 些 列 对 应 RFI 信 号 。 根 据 以 上 分 析 ， 可 用 标准 差 向 量 std 与 中 值 向 量 med 
点 除 得 到 判别 向 量 4， 即 ， 某 一 列 中 值 越 大 标准 差 越 小 则 对 应 该 判别 向 量 元 素 值 越 大 : 

d=med./std (13) 

其 中 ， 标 准 差 向 量 和 中 值 向 量 分 别 由 矩阵 A 各 列 标准 差 std1,…, std BUF Emedi, +++, med n ZH. 
成 ， 即 
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i=1,…n, j =1,---m. (14) 


1 
std; = Vp med , =|median(a,,)], 


j i=l 


其 中 ,jy 入;， 分 别 表示 矩阵 A 第 j 列 均值 和 元 素 个 数 ，median(-) 表 示 中 值 函数 。 若 第 j, 
个 源 信 号 s;(1) 对 应 脉冲 星 信号 ， 则 其 余 O Gj 对 应 REL 信号 。 由 上 述 分 析 可 知 ， 应 
选择 判别 向 量 元 素 最 大 值 所 在 列 对 应 的 源 信号 为 脉冲 星 信 号 。 即 jp, A 

J 


HP, di, … dm 组 成 判别 向 量 4。 需 注意 ， 此 时 sy (t) 包含 了 各 频率 通道 脉冲 星 信号 信息 ， 


并 非 图 1 展现 形式 。 由 混合 矩阵 A 各 元 素 含义 可 知 , 通过 以 下 变换 可 得 到 以 图 1 形式 呈现 的 
AR RFI 后 脉冲 星 射 电信 和 号 : 


x =Å 5 (16) 


P P 


Hp, EREA ICR a Te EAB, oe, PERRINE. 


2.3 RESO 


FH F-FastICA 22 SUD, ZI S RUE EREMIA Gp) 中。 
m SOY FE BEA UE — BIE, 使 得 恢复 出 的 信号 % 尽 可 能 完整 包含 脉冲 星 信号 ,同时 尽量 少 包 
含 RFI。 注 意 到 残留 脉冲 星 信 号 不 论 在 频率 上 还 是 脉冲 相位 上 分 布 相对 RFI 更 均匀 。 通 过 实 
验 我 们 发 现 ， 可 将 K 倍 和 矩阵 A 除 去 第 疡 列 后 的 标准 差 作 为 阔 值 ， 并 把 和 矩阵 A 中 满足 


la,|<kxstd(A,) (17) 


的 元 素 加 入 Ap 中 ， 以 修正 A,。 修 正 后 的 A) 通 过 式 (16) 可 较 完 整 恢复 脉冲 星 信 号 。(17) 式 中 
std(A ,) 表示 和 窍 阵 A 除 去 第 吉 列 元 素 后 的 标准 差 。 系数 k 选 取 过 小 则 少量 脉冲 星 信 号 会 被 当 作 


RFI 被 消除 , 过 大 则 RFI 消 除 不 彻底 。 但 需要 指出 的 是 : 本 文 算法 对 k 值 并 不 敏感 , 取 0.5 sk < 
2.5 可 获得 信 品 比 大 于 50 的 脉冲 星 积分 轮廓 ， 满 足 改善 脉冲 星 观测 的 需求 。 在 遵循 消除 RFI 
且 尽 量 保持 脉冲 星 信号 这 一 原则 下 , 我 们 选取 上 = 1。 关 于 K 值 对 REFI 消 除 结果 的 影响 详 见 本 文 
实验 部 分 。 


3 实验 


3. 1 实验 数据 


实验 数据 来 自 云 南天 文 台 40 米 射电 望远镜 S 波 段 (2150MHz~2450MHz) 脉冲 星 日 常 观 
测 结果 ， 观 测 终端 为 从 澳大利亚 CISRO 引 进 的 脉冲 星 观 测 终 端 PDFB4 (Pulsar Digital 
FilterBank 4) 。PDFB4 对 观测 数据 处 理 过 程 包括 : 非 相干 消 色 散 和 周期 轮廓 折 又 。 数 据 采 样 
实现 对 脉冲 星 信号 数据 采集 (采样 率 为 640s)。 观 测 中 心 频率 2256MHz， 脉 冲 星 的 观测 方式 
为 非 相 干 消 色 散 ， 观 测 配 置 为 512MHz-512Bin-512Chan，30 秒 的 子 积分 ， 数 据 存储 格式 为 
PSRFITS 格 式 。 由 于 40 米 射电 望远镜 距离 昆明 市 区 较 近 ， 存 在 较 强 RFI， 如 2G、3G、4G 手 
机 信号 频段 和 WIFI 频 段 。 为 避免 引起 观测 设备 系统 饱和 ， 观 测 时 需 利用 滤波 器 设备 在 射频 
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波段 直接 将 上 述 信 号 噜 除 ， 吻 除 上 述 干 扰 后 ，S 波 段 仅 留 下 60MHz 人 至 140MHz 相 对 干净 的 观 
测 带宽 。 实 际 观测 频段 为 2170 MHz~2310MHz。 在 该 带宽 内 仍 存在 各 种 类 型 的 未 引起 系统 饱 
和 的 干扰 。 


3. 2 实验 结果 


为 验证 本 文 方法 的 效果 和 可 行 性 ， 利 用 该 方法 对 J0332+5434 脉 冲 星 观测 数据 进行 处 理 。 
对 此 我 们 选取 该 脉冲 星 在 2017 年 $ 波 段 日 常 观测 中 比较 有 代表 性 的 观测 数据 。 图 2(a) 非 常 清 
晰 地 显示 出 观测 干扰 频 点 分 别 为 2231~2241MHz, 2252MHz~2258MHz, 2267MHz~2273MHz， 
2300MHz~2308MHz。 其 中 第 >、3 个 干扰 频 点 呈现 出 干扰 信号 强 、 持 续 时 间 长 的 特点 ， 而 第 
1 个 干扰 频 点 非常 弱 ， 通 过 多 个 子 积 分 后 在 图 3(a) 中 相对 明显 ， 第 4 个 干扰 频 点 在 相位 上 显现 
出 不 确定 性 。 实 验 结 果 如 图 xb) 所 示 。 从 图 中 可 看 出 REFI 基 本 消除 ， 仅 保留 下 了 PSR 
J0332+5434 脉 冲 星 信号 。 图 2(c) 则 显示 了 图 2(a) 与 (0) 的 差 值 信号 ， 即 ，FRI 信 和 号。 


Frequency(MHz) 


Pulse Phase 
(a) 


2300 


Frequency(MHz) 
8 R 
i=) Oo 
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(b) 


Frequency(MHz) 


Pulse Phase 


(c) 
图 2 J0332+5434 RFI 消除 效果 ，(a) 观 测 数 据 ，(b)RFI 消除 结果 ; (c) 差 值 信号 
Fig.2 RFI mitigation for J0332+5434 (a) observed signal (b) result of RFI mitigation using ICA (c) difference signal 
通过 此 实验 ， 还 可 对 与 ICA 在 原理 上 有 相似 之 处 的 独立 成 分 分 析 方 法 (Independent 
Component Analysis, PCA) 进行 对 比分 析 和 讨论 。ICA 和 PCA 同 属 因 子 分 析 ， 都 是 通过 线性 
组 合 后 使 得 某 种 特征 最 大 化 。PCA 寻 求 方差 最 大 化 ， 而 ICA 寻 求 非 高 斯 性 最 大 化 : PCA 找 出 
言 号 中 不 相关 部 分 ， 对 应 二 阶 统计 量 分 析 ，ICA 找 出 构成 信号 的 相互 独立 部 分 ， 对 应 高 阶 统 
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计量 分 析 。 但 PCA 和 ICA 用 途 不 同 。PCA 是 目前 数据 降 维 的 和 常用 方法 ， 如 果 只 在 意 数据 的 能 
量 或 方差 , 假设 干扰 信号 都 比较 微弱 ， 可 用 PCA 分 离 出 主要 信和 号。 但 在 射电 天 文 RFI 消 除 中 ， 
很 多 情况 下 强 弱 干扰 混合 在 一 起 ， 例 如 ， 2(a) 显示 的 脉冲 星 观测 信号 中 ， 位 于 
2252MHz~2258MHz ， 2267MHz~2273MHz 频 点 的 干扰 明显 强 于 脉冲 星 信 号 ， 而 
2231~2241MHz 频 点 的 干扰 信号 又 比 脉 冲 星 信 号 弱 很 多 ，2300MHz~2308MHz 频 点 的 干扰 信 
号 在 强度 上 与 脉冲 星 信 号 接近 。 使 用 PCA， 如 果 以 信号 强度 度量 ， 很 难 确定 哪些 主 分 量 对 应 
REFI， 哪 些 对 应 射电 信号 。 而 在 某 种 意义 上 ，ICA 更 智能 一 一 它 不 在 意 信号 的 能 量 或 方差 ， 
只 看 独立 性 。 给 定 竺 分解 的 混合 信号 经 任意 线性 变换 不 会 影响 ICA 和 输出 结果 ， 但 会 严重 影响 
PCA 结 果 。 当 然 如 能 找到 除 能 量 之 外 的 其 他 特征 ,并 且 在 此 特征 维度 下 使 射电 信号 能 成 为 主 
分 量 ， 而 RFI 成 为 次 要 分 量 ， 则 可 运用 PCA 分 解 射电 信号 和 RFI。 

在 现实 应 用 中 ， 对 脉冲 星 连续 观测 信号 取 均 值 是 一 种 有 效 且 常用 的 RFI 消 手段 。 图 3(a) 
显示 了 对 PSR J0332+5434 脉 冲 星 连续 96 个 子 积分 观测 信和 号 求 取 均 值 的 结果 。 图 中 可 明显 看 
到 ， 在 脉冲 星 信 号 增强 的 同时 ，RFI 信 号 也 被 强化 。 图 3(b) 为 采用 本 文 方法 对 96 个 子 积分 观 
测 信 号 分 别 消除 RFI， 然 后 求 取 均 值 的 结果 ,图 中 可 看 出 ,在 较 好 保留 脉冲 星 信 号 同时 ，RFI 
SEAMS EAR. A 3(c) 为 图 3(a) 与 (b) 的 差 值 信号 ， 即 ，96 个 子 积分 观测 信号 求 取 均 值 后 
的 REFI 信 号 。 图 3(a)~(c) 展 示 了 本 文 方法 对 脉冲 星 观测 信号 中 RFI 消 除 的 明显 效果 。 然 而 仔细 
观察 ， 图 3(c) 中 出 现 了 少量 脉冲 星 信 号 残余 。 这 主要 由 于 FastICA 是 对 负 炳 求 近似 解 ， 从 而 
导致 2231~2241MHz 弱 REFI 信 号 与 残留 的 少量 脉冲 星 信 号 对 应 的 独立 分 量 难以 区 分 。 但 相对 
于 目前 普遍 采用 的 均值 方法 ， 本 文 方法 明显 改善 了 脉冲 星 观测 信号 。 这 一 效果 也 能 从 图 4 所 
示 的 脉冲 星 轮 廓 中 观测 得 到 。 
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图 3 J0332+5434 积分 均值 信号 RFI 消除 效果 : (a) 观测 信号 积分 均值 ，(b) RFI 消除 结果 ; (©) 差 值 信号 
Fig 3. RFI mitigation for J0332+5434 after mean of accumulation: (a) observed signal after mean of accumulation (b) RFI mitigation 


result (c) difference signal 


为 更 直观 反映 本 文 方法 的 有 效 性 ， 图 4 显示 了 对 图 3(a)、(b) 沿 频率 域 积 分 后 脉冲 星 轮廓 
图 。 其 中 ， 图 4(a) 为 均值 法 消除 REFI 后 的 脉冲 星 信 号 积分 轮廓 图 ， 图 4(b) 为 采用 本 文 方法 ， 
且 式 (7) 中 性 1 时 消除 REFI 后 的 脉冲 星 信号 积分 轮廓 图 。 两 幅 轮 廓 图 中 均 能 清晰 看 到 PSR 
J0332+5434 脉 冲 星 的 三 峰 结构 , 但 对 比 均 值 法 消除 结果 可 看 出 , 本 文 方法 有 效 消 除了 观测 信 
号 中 的 RFI 信 号 , 且 脉 冲 星 信号 得 到 较 完整 保留 。 此 外 , 通过 脉冲 星 轮廓 信 噪 比 (Signal Noise 
Ratio, SNR) 70), 
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可 计算 出 图 4a)、 图 4b) 的 信 噪 比分 别 为 17.69 和 60.28。 其 中 一 、 互 和 网。 分 别 为 脉冲 星 轮 
图 非 脉冲 部 分 均值 、 标 准 差 ， 和 轮廓 宽度 。 
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(a) (b) 
图 4 不 同 REL 消除 方法 消除 RFI 后 J0332+5434 脉冲 星 轮 廓 图 对 比 (a) 均 值 法 ，(b) 本 文 方法 


Fig 4. Comparison of pulse profiles of PSR J0332+5434 after different method of RFI mitigation: (a) mean of accumulation (b) approach 
proposed by this paper 

5 显示 了 式 (17) 中 k 取 0~3 时 ， 采 用 本 文 方法 对 PSR J0332+5434 iki IE AL96 FANS 
观测 信号 进行 RFI 消 除 并 求 取 均 值 后 积分 轮廓 图 SNR 变 化 情况 。 由 图 可 看 出 在 上 = 0.69 时 ， 
SNR 达 到 峰值 60.37， 之 后 开始 衰减 。 分 析 原 因 ，K 较 小 时 ， 在 FRI 消除 结果 中 由 式 (17) 引 入 的 
残留 脉冲 星 信号 对 SNR 提 升 产 生 的 贡献 大 于 由 此 引入 的 RFI 对 SNR 的 影响 ， 从 而 SNR 上 升 ; 
但 随 着 k 的 增加 , 过 多 引入 弱 RFI 的 负面 影响 将 增 大 , 导致 SNR 下 降 。 值得 注意 的 是 , 取 0.5 < 
k < 2.5 可 获得 信 品 比 大 于 50 的 脉冲 星 积分 轮廓 。 通 过 式 (17) 在 RFI 消 除 结果 中 尽量 包含 完整 
脉冲 星 信号 是 一 相互 平衡 的 过 程 ， 因 此 实现 时 ， 在 遵循 消除 RFI 且 尽量 保持 脉冲 星 信 号 这 一 
原则 下 ， 并 未 选取 SNR 取 得 峰值 时 的 k 值 ， 而 是 选取 k=1。 相 对 目前 常用 的 对 脉冲 星 连续 观测 
言 号 取 均 值 以 高 SNR 的 方法 ， 本 文 方法 对 SNR 提 升 效果 明显 。 此 效果 在 图 ~ 图 4 实验 结果 中 
也 有 所 反映 。 
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图 5 大 值 对 RFI 消除 信 噪 比 影响 


Fig 5. Impact of k on signal noise ratio in RFI mitigation 


4 结论 


RFI 广 泛 存在 于 射电 天 文 观测 中 ， 而 脉冲 星 射 电 观 测 信号 可 视 为 RFI 信 号 与 脉冲 星 信和 号 
的 混合 信号 。 基 于 各 RFI 信 号 和 脉冲 星 信 号 间 统 计 上 相互 独立 且 各 信号 符合 非 高 斯 分 布 的 特 
性 ， 本 文 提出 基于 独立 成 分 分 析 的 RFI 消 除 方法 。 相 比 已 有 方法 ， 首 先 ， 无 需 人 为 选择 或 构 
造 RFI 结 构 特征 ， 不 存在 阔 值 选择 的 困惑 ， 其 次 ， 不 存在 训练 或 学 习 过 程 ， 因 此 无 需 考虑 构 
建 训练 样本 的 问题 。 使 用 该 方法 对 云南 天 文 台 40 米 射电 望远镜 接收 到 的 脉冲 星 观 测 信和 号 进行 
独立 成 分 分 析 ， 分 解 出 独立 的 REFI 信 号 和 脉冲 星 信号 ， 进 而 实现 RFI 消 除 。 本 文 方法 在 干扰 
言 号 消除 、 射 电信 和 号 保留 及 信 噪 比方 面 均 取 得 较 好 效果 , 为 进一步 提高 脉冲 星 观测 数据 利用 
率 黄 定 恨 好 基础 。 此 外 ,本 文 所 提 方 法 不 仅 适 用 于 脉冲 星 射 电信 号 处 理 ， 对 其 他 射电 天 文 信 
号 处 理 也 具有 借鉴 意义 。 但是， 由 于 FastICA 对 负 业 求 近似 解 ， 使 得 弱 RFI 信 号 与 残留 的 少量 
脉冲 星 信号 对 应 的 独立 分 量 区 分 度 较 小 ， 导 致 出 现 残 差 图 像 中 存在 少量 脉冲 星 信号 的 问题 。 
后 续 研 究 中 我 们 将 进一步 深入 对 该 问题 的 研究 。 
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Abstract: Radio astronomy has become an important way to study the universe. However, 
with the development of human production and life, radio frequency interference (RFI) has more 
and more serious impact on radio astronomical observation. The quality of observation is related 


to the quality of scientific achievements and even the authenticity of conclusions. At present, RFI 
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detection based on threshold is widely used, and part of the observed data is directly discarded for 
the interference. Such methods have difficulties in determining threshold values, and reduce 
observation bandwidth and time. Observed the fact that interferences and radio signals are 
Statistical independence and each is non-Gaussian, we propose a novel approach for radio 
frequency interference mitigation using independent component analysis to decompose the mixed 
signal, then identifies the pulsar signal according to the different distribution characteristics 
between the pulsar signal and RFI signals. The pulsar observations received from 40-meter radio 
telescope in Yunnan Observatories are processed by the new approach. The results show: RFI 
signals in pulsar observations are cleanly mitigated while little affecting pulsar signal and good 
signal-to-noise ratio is achieved. 
Key words: Radio frequency interference; Independent component analysis; Pulsar; 

Interference signal mitigation 
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